DE eng

Search in the Catalogues and Directories

Page: 1 2
Hits 1 – 20 of 24

1
『日本語歴史コーパス』統合語彙表(バージョン2022.03)
BASE
Show details
2
『日本語歴史コーパス』短単位統合語彙表(バージョン2021.03)
BASE
Show details
3
コーパスで日本語の歴史を探る : 「通時コーパス」プロジェクトの取り組み
In: https://www2.ninjal.ac.jp/openhouse/2019/ (2021)
BASE
Show details
4
コーパスを使った日本語の歴史の研究
In: https://www2.ninjal.ac.jp/openhouse/2018/ (2021)
BASE
Show details
5
『日本語歴史コーパス』の紹介
In: https://www2.ninjal.ac.jp/openhouse/2020/ (2021)
BASE
Show details
6
多重の読みを持つ宣命コーパスの構築
In: http://id.nii.ac.jp/1001/00208605/ (2020)
BASE
Show details
7
近代の歴史的資料を対象とした機械学習による文境界推定
In: http://id.nii.ac.jp/1001/00203040/ (2020)
BASE
Show details
8
「人情本コーパス」の設計と構築
藤本 灯; 北﨑 勇帆; 市村 太郎. - : 国立国語研究所, 2017
BASE
Show details
9
多重の読みを持つテキストのコーパス化
In: http://pj.ninjal.ac.jp/corpus_center/lrw2016.html (2017)
BASE
Show details
10
『日本語歴史コーパス』における原文KWIC表示機能の実装
In: http://pj.ninjal.ac.jp/corpus_center/lrw2017.html (2017)
BASE
Show details
11
日本語コーパスの包括的検索環境の実現に向けて
In: http://pj.ninjal.ac.jp/corpus_center/lrw2016.html (2017)
BASE
Show details
12
〈著書紹介〉 近藤泰弘,田中牧郎,小木曽智信 編 『コーパスと日本語史研究』
小木曽 智信. - : 国立国語研究所, 2016
BASE
Show details
13
『現代日本語書き言葉均衡コーパス』の文境界修正
Abstract: 国立国語研究所 コーパス開発センター 非常勤研究員 ; マンパワーグループ株式会社 ; 国立国語研究所 理論・構造研究系 非常勤研究員 ; 国立国語研究所 コーパス開発センター 非常勤研究員 ; 国立国語研究所 言語資源研究系 ; 国立国語研究所 コーパス開発センター 技術補佐員(元) ; 国立国語研究所 コーパス開発センター プロジェクト研究員 ; 文部科学省 ; 国立国語研究所 言語資源研究系 ; 国立国語研究所 言語資源研究系 ; 国立国語研究所 言語資源研究系 ; 国立国語研究所 言語資源研究系 ; 国立国語研究所 言語資源研究系 ; Adjunct Researcher, Center for Corpus Development, NINJAL ; Manpower Group Co., Ltd ; Adjunct Researcher, Department of Linguistic Theory and Structure, NINJAL ; Adjunct Researcher, Center for Corpus Development, NINJAL ; Department of Corpus Studies, NINJAL ; (former) Technical Staff, Center for Corpus Development, NINJAL ; Postdoctoral Research Fellow, Center for Corpus Development, NINJAL ; Ministry of Education, Culture, Sports, Science, and Technology ; Department of Corpus Studies, NINJAL ; Department of Corpus Studies, NINJAL ; Department of Corpus Studies, NINJAL ; Department of Corpus Studies, NINJAL ; Department of Corpus Studies, NINJAL ; 『現代日本語書き言葉均衡コーパス』第1.0版(Maekawa et al. 2014)(以下BCCWJ)には「文境界」の情報がアノテーションされているが,その認定基準の妥当性について従来から様々な指摘がある(小西ほか2014,長谷川2014,田野村2014)。この問題に対処するために,国立国語研究所コーパス開発センターでは2013年から2014年にかけて,BCCWJの修正を行った。本稿ではその修正作業について報告する。第1.0版におけるBCCWJ 文境界情報の問題は,コーパス構築の過程において文境界を含む文書構造タグの整備と形態素列レベルの情報の整備とを並行して行ったために,文字情報を用いる文境界処理にとどまったことに由来する。今回,形態論情報に基づいた文境界基準を策定し,問題の解消を試みた。文境界修正の指針を示すとともに,文境界修正に用いた作業環境と,修正件数について報告する。 ; In December 2011, the National Institute for Japanese Language and Linguistics (NINJAL) released a 100-million-word balanced corpus - the Balanced Corpus of Contemporary Written Japanese (BCCWJ) DVD Version 1.0 - which was compiled from 2006 through 2011. Some users have pointed out some issues concerning sentence delimitation in the BCCWJ. To address these issues, we - NINJAL - performed a complete survey and correction, beginning in 2013 and ending in 2014. This article reports the revision work on sentence delimitation in the BCCWJ. The problems with the BCCWJ DVD Version 1.0 derive from the string-based definition. We could not obtain any morpheme information for the sentence delimitation task because of the task parallelism between sentence delimitation annotation and morpheme annotation. The method used this time was morpheme based. We present the morpheme-based annotation guidelines, annotation environment, and basic statistics of the corpus correction.
Keyword: annotation; BCCWJ; error correction environment; error correction standard; sentence boundary; アノテーション; 修正基準; 修正環境; 文境界; 現代日本語書き言葉均衡コーパス
URL: https://repository.ninjal.ac.jp/?action=repository_uri&item_id=471
http://id.nii.ac.jp/1328/00000462/
https://repository.ninjal.ac.jp/?action=repository_action_common_download&item_id=471&item_no=1&attribute_id=54&file_no=1
BASE
Hide details
14
パネル・ディスカッション
清水 康行; 小林 千草; 田中 牧郎. - : 国立国語研究所, 2014
BASE
Show details
15
〈共同研究プロジェクト紹介〉萌芽・発掘型 : 統計と機械学習による日本語史研究 歴史的日本語資料のアノテーションと自動濁点付与
小木曽 智信; Toshinobu OGISO. - : 国立国語研究所, 2013
BASE
Show details
16
中古和文における個人文体とジャンル文体 : 多変量解析による歴史的資料の文体研究
小林 雄一郎; 小木曽 智信; Yuichiro KOBAYASHI. - : 国立国語研究所, 2013
BASE
Show details
17
〈受賞紹介〉 中古和文を対象とした形態素解析辞書の開発
小木曽 智信. - : 国立国語研究所, 2012
BASE
Show details
18
〈全文〉 近代語コーパス設計のための文献言語研究 成果報告書
田中 牧郎; 岡島 昭浩; 小木曽 智信. - : 国立国語研究所, 2012
BASE
Show details
19
近代語テキストの形態素解析
小木曽 智信; Toshinobu OGISO. - : 国立国語研究所, 2012
BASE
Show details
20
『現代日本語書き言葉均衡コーパス』形態論情報データベースの設計と実装 改訂版
小木曽 智信; 中村 壮範. - : 国立国語研究所, 2011
BASE
Show details

Page: 1 2

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
24
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern